Search CORE

41 research outputs found

Fonética experimental y tecnologías del habla

Author: Garrido Almiñana Juan María
Publication venue
Publication date: 01/01/2015
Field of study

Las relaciones entre Fonética y Tecnología del Habla han sido objeto de debate reiterado en la bibliografía de ambas disciplinas, debate en el que se ha puesto de manifiesto, por un lado, la innegable necesidad del conocimiento lingüístico en el desarrollo de estas tecnologías, y por otro, los problemas y limitaciones que ha supuesto en ocasiones para la Tecnología del Habla la falta de descripciones y modelos fonéticos adecuados, lo que ha llevado en muchos casos a la búsqueda de «caminos alternativos», principalmente en la estadística y la probabilidad. Este artículo pretende ofrecer una reflexión personal sobre las relaciones entre ambas disciplinas, en el momento actual y en un futuro próximo, analizando, por un lado, en qué medida el conocimiento fonético puede contribuir al desarrollo de las tecnologías del habla en los próximos años, y por otro, de qué forma la Tecnología del Habla puede ayudar a mejorar los métodos y resultados del trabajo teórico en Fonética experimental

Repositori d'Objectes Digitals per a l'Ensenyament la Recerca i la Cultura

DIALNET

Eines computacionals per a la creació i explotació de corpus orals en català

Author: Garrido Almiñana Juan María
Publication venue: Romanische Seminare der Universitäten Bochum und Freiburg
Publication date: 01/07/2020
Field of study

Summary: The goal of this article is to review the inventory of computational tools currently available for the development of oral corpora in Catalan, from their design to their exploitation once they have been developed. Several tools for the design, transcription, annotation and exploitation are described and analysed, and an example of oral corpus in Catalan developed and exploited using this kind of tools is also presented. The final conclusion is that the existing tools may help to make easier the creation and exploitation tasks of oral corpora in Catalan, although more efforts are still necessary to improve the existing tools and to create new ones. Keywords: corpora, speech, orality, computational tools, Catala

Ruhr-Universität Bochum (RUB): Open Journal Systems

Modelling Spanish Intonation for Text-to-Speech Applications

Author: Garrido Almiñana Juan María
Publication venue: Bellaterra : Universitat Autònoma de Barcelona,
Publication date: 03/07/1996
Field of study

Consultable des del TDXTítol obtingut de la portada digitalitzad

LAReferencia - Red Federada de Repositorios Institucionales de Publicaciones Científicas Latinoamericanas

Tesis Doctorals en Xarxa

Diposit Digital de Documents de la UAB

Glissando, un corpus anotat per a l'anàlisi de la prosòdia del català i del castellà. Descripció i primers resultats d'explotació

Author: Garrido Almiñana Juan María
Publication venue: 'Edicions de la Universitat de Barcelona'
Publication date: 01/03/2014
Field of study

En aquest article es descriu Glissando, un nou corpus anotat per a l’estudi multidisciplinar de la prosòdia en castellà i català que ha estat desenvolupat en el marc d’un projecte coordinat pel Grup de Lingüística Computacional (GLiCom) de la Universitat Pompeu Fabra. S’en descriuren els trets principals, amb una atenció especial al subcorpus en català, l’estat actual, i es presenten les primeres dades d’explotació pel que fa a la definició dels patrons entonatius del català, com una mostra de les seves potencialitats per a l’anàlisi de la prosòdia del català.This article describes Glissando, a new annotated corpus for the multidisciplinary study of Prosody in Spanish and Catalan which has been developed as a result of a research project coordinated by the Computational Linguistics Group (GLiCom) at Pompeu Fabra University. Main features of the corpus are described, paying special attention to the Catalan subcorpus, its current state is outlined, and first exploitation results on the definition of melodic patterns for Catalan are presented, as an example of the possibilities which the corpus offers for the analysis of Catalan Prosody.En este artículo se describe Glissando, un nuevo corpus anotado para el estudio multidisciplinar de la prosodia en castellano y catalán que se ha desarrollado en el marco de un proyecto coordinado por el Grupo de Lingüística Computacional (GLiCom) de la Universidad Pompeu Fabra. Se describen sus rasgos principales, con una atención especial al subcorpus en catalán, su estado actual, y se presentan los primeros datos de explotación en lo que se refiere a la definición de los patrones entonativos del catalán, como una muestra de sus potencialidades para el análisis de la prosodia del catalán

Directory of Open Access Journals

Revistes CientÃfiques de la Universitat de Barcelona

On the Need of Standard Assessment Metrics for Automatic Speech Rate Computation Tools

Author: Elvira-García Wendy
Farrús Mireia
Garrido-Almiñana Juan María
Publication venue
Publication date: 01/06/2021
Field of study

Comunicació a congrès: 4th Phonetics and Phonology in Europe 2021 (PaPE 2021): Phonetics and Phonology: Real-world applications. 21 to 23 June 2021. Barcelona. Virtual

Diposit Digital de la Universitat de Barcelona

Comparación de dos métodos basados en la intensidad para el cálculo automático de la velocidad de habla

Author: Elvira-García Wendy
Farrús Mireia
Garrido Almiñana Juan María
Publication venue: 'Editorial CSIC'
Publication date: 09/06/2023
Field of study

Automatic computation of speech rate is a necessary task in a wide range of applications that require this prosodic feature, in which a manual transcription and time alignments are not available. Several tools have been developed to this end, but not enough research has been conducted yet to see to what extent they are scalable to other languages. In the present work, we take two off-the- shelf tools designed for automatic speech rate computation and already tested for Dutch and English (v1, which relies on intensity peaks preceded by an intensity dip to find syllable nuclei and v3, which relies on intensity peaks surrounded by dips) and we apply them to read and spontaneous Spanish speech. Then, we test which of them offers the best performance. The results obtained with precision and normalized mean squared error metrics showed that v3 performs better than v1. However, recall measurement shows a better performance of v1, which suggests that a more fine-grained analysis on sensitivity and specificity is needed to select the best option depending on the application we are dealing with.El cálculo automático de la velocidad de habla es una tarea fonética útil y que además se hace indispensable cuando no hay disponible una transcripción manual a partir de la cual determinar una tasa de habla manual. Se han desarrollado varias herramientas para este fin, pero todavía no se ha llevado a cabo suficiente investigación para ver hasta qué punto las herramientas son aplicables a lenguas distintas para las que fueron diseñadas. En este artículo probamos dos herramientas para el cálculo automático de la velocidad de habla ya evaluadas para el neerlandés y el inglés (v1, que se basa en la determinación de picos de intensidad precedidos de un valle para encontrar núcleos de sílaba, y v3, que se basa en picos de intensidad rodeados de valles) y las aplicamos a un corpus de habla leída y espontánea del español para analizar cuál ofrece mejores resultados en español. Los resultados de precisión y del error cuadrático mediano normalizado obtenidos muestran que v3 funciona mejor que v1. No obstante, el recall muestra mejor rendimiento para la v1, lo que nos indica que se necesita un análisis detallado de la sensibilidad y la especificidad para seleccionar la mejor opción en función de los objetivos del análisis posterior que se quiera hacer

Loquens (E-Journal)

On the definition of a prosodically balanced corpus : combining greedy algorithms with expert guided manipulation

Author: Aguilar Lourdes
Bonafonte Antonio
Escudero David
Garrido Almiñana Juan María
Publication venue
Publication date: 01/01/2009
Field of study

Este artículo presenta el proceso de definición de un corpus de texto equilibrado en términos de atributos prosódicos. Se presenta formalmente la aplicación de algoritmos voraces y se discuten sus limitaciones. Además, se propone una guía de manipulación de textos que contribuye a mejorar considerablemente los resultados. El trabajo experimental constata este hecho con la aplicación de la metodología en diversos corpus de noticias radiofónicas en españolThis article reports the process of building a balanced text corpus taking into account prosodic features. We formalize the application of greedy algorithms for text selection and we discuss their limitations. We also defend an expert guideline for text manipulation that significantly improves the performance of the algorithms. The application of this methodology to a radio news corpus empirically supports the proposed strateg

Diposit Digital de Documents de la UAB

Estudio acústico de la variación inter e intralocutor en la frecuencia fundamental de hablantes bilingües de catalán y de castellano

Author: Garrido Almiñana Juan María
Llisterri Joaquim
Marquina Zarauza Montserrat
Universitat Autònoma de Barcelona. Facultat de Filosofia i Lletres
Publication venue
Publication date: 01/01/2011
Field of study

Este trabajo pretende contribuir a establecer la individualidad de la voz de los hablantes bilingües equilibrados de catalán y de castellano a partir del análisis de la frecuencia fundamental y estudiar los efectos, en el nivel acústico, que el uso de una lengua u otra produce en este parámetro. Se pretende obtener, así, parte del conocimiento fonético necesario para la mejora de los sistemas de reconocimiento, identificación o verificación automáticos del locutor y proporcionar a los especialistas en fonética judicial nuevos datos acústicos para que puedan comparar con un mayor grado de certeza locutores dubitados e indubitadosAquest treball vol contribuir a establir la individualitat de la veu dels parlants bilingües equilibrats de català i de castellà a partir de l'anàlisi de la freqüència fonamental i estudiar els efectes, en el nivell acústic, que l'ús d'una llengua o l'altra provoca en aquest paràmetre. Es vol obtenir, per tant, part del coneixement fonètic necessari per a millorar els sistemes de reconeixement, identificació o verificació automàtics del locutor i dotar els especialistes en fonètica judicial de dades acústiques noves que els permetin comparar, amb un grau més elevat de certesa, locutors dubitats i indubitat

Diposit Digital de Documents de la UAB

Methods in prosody: A Romance language perspective

Author: Astruc Lluïsa
Buchholz Timo
de Moraes João Antônio
Feldhausen Ingo
Fliessbach Jan
Garrido Almiñana Juan María
Gili Fivela Barbara
Kellert Olga
Panizza Daniele
Petrone Caterina
Pešková Andrea
Prieto Pilar
Reich Uli
Rilliard Albert
Vanrell Maria del Mar
Publication venue: Language Science Press
Publication date: 25/10/2018
Field of study

This book presents a collection of pioneering papers reflecting current methods in prosody research with a focus on Romance languages. The rapid expansion of the field of prosody research in the last decades has given rise to a proliferation of methods that has left little room for the critical assessment of these methods. The aim of this volume is to bridge this gap by embracing original contributions, in which experts in the field assess, reflect, and discuss different methods of data gathering and analysis. The book might thus be of interest to scholars and established researchers as well as to students and young academics who wish to explore the topic of prosody, an expanding and promising area of study

Language Science Press

Methods in prosody: A Romance language perspective

Author: Astruc Lluïsa
Buchholz Timo
de Moraes João Antônio
Feldhausen Ingo
Fliessbach Jan
Garrido Almiñana Juan María
Gili Fivela Barbara
Kellert Olga
Panizza Daniele
Petrone Caterina
Pešková Andrea
Prieto Pilar
Reich Uli
Rilliard Albert
Vanrell Maria del Mar
Publication venue: Language Science Press
Publication date: 25/10/2018
Field of study

Language Science Press